【資料公開】DevIO 2024 福岡で「運用上の優秀性」について語りました #devio2024

【資料公開】DevIO 2024 福岡で「運用上の優秀性」について語りました #devio2024

過日行われたオフライン 2 Days イベント「DevelopersIO 2024 FUKUOKA」にて、運用と監視、そして可観測性(オブザーバビリティ)の関係について、New Relicのデモをまじえつつ登壇させていただきました
Clock Icon2024.08.05

みなさん、監視してますか!(挨拶

過日行われたオフライン 2 Days イベント「DevelopersIO 2024 FUKUOKA」は、お足元の悪いなか多数ご来場頂き、盛況のうちに幕を閉じることができました。

ご来場頂いたみなさま、本当にありがとうございました!


https://classmethod.connpass.com/event/317870/

ぼくも「運用の優秀性 5つのステージと可観測性」というタイトルで、運用と監視、そして可観測性(オブザーバビリティ)の関係について、New Relicのデモをまじえつつ登壇させていただきました。
その時の資料を公開いたします。

以下、簡単に解説します。

運用上の優秀性

本セッションは、以下の記事で解説されている「 The journey to operational excellence 」をベースに構築しました。


https://www.assetivity.com.au/articles/reliability-improvement/reliability-in-operations/

reliability-operations-improvement
前述記事より転載 : Figure 1 – Journey to Operational Excellence

この図自体は 1990 年代に起源があり、複雑化した現在ではこのような紋切り型では説明できないのですが、それでもこの要素と考え方は有効です。本セッションではこの図に当てはめ、「 Reactive (Fix it after it breaks)」ステージ[1]では本来の意味の「監視」が重要という説明をしました。

「異常を検知したら通知する」と定義される「監視」ですが、異常を検知するためには「いまシステムの中で何が起きているのか」を知る(観測する)必要があります。
この、システムの中で起きていることを観測すること、それがどのくらい可能であるか、を指し示す言葉が「可観測性(オブザーバビリティ)」です。

つまり、なにがしかの監視ができているということは、多少なりとも可観測性が備わっていることになります。

そして「監視」とは運用の一部です。一方で「システムで起きていることを観測する」ことは、一般的に言われる「運用」の枠に収まらない応用が可能です。
このことを端的に表現したのが下のスライドです。

202407-the-journey-to-operational-excellence-devio2024fukuoka_1_1600.jpg

監視と可観測性の関係を気象の世界に例えてみたのがこちらのスライドです。

202407-the-journey-to-operational-excellence-devio2024fukuoka_2_1600.jpg

さてここで最初のモデルに戻るのですが、では「 Reactive 」の次のステージ「 Planned 」において、監視と可観測性の関係はどうなるでしょうか?

Reactive、つまり「壊れたら(それを検知して)修正する」という運用であれば、たいした可観測性は必要ありません。「壊れたら動かなくなるところ」だけを重点的に観測すれば済みます。

しかし Planned つまり「故障や動作不良などを事前に予測し、計画的に修正する」ためには、より広く観測し、その観測データをより包括的に評価しなくてはなりません。
対象となるシステムがどんどんと複雑化していくなか、従来までの考え方の「監視」だけでは間に合わなくなっています。より高い可観測性を前提とする「監視」へとアップグレードする必要があるということで。

あまり広く使われている言葉ではないかもしれませんが、そのことをここでは監視のモダナイゼーション(現代化)、「モダン監視」と表現しました。

202407-the-journey-to-operational-excellence-devio2024fukuoka_3_1600.jpg

先ほどの気象の例でいえば、ゲリラ豪雨や線状降水帯など複雑化する状況、また「いま居る場所の 10 分後の天気を知りたい」という世間のニーズに合わせ、より精度の高い予測をするイメージでしょうか。

そのためにはただ単に「どこそこで雨がふった」だけでなく、周辺の洋上まで観測の網を広げ、より高度な気象シミュレーションを行えるスーパーコンピュータを用意して、雨雲や台風発生の予兆を捉えていく必要があるでしょう。

202407-the-journey-to-operational-excellence-devio2024fukuoka_4_1600.jpg

それら全てを自前で用意するのは、正直無理があります。出来ないことはないし、メリットがあるケースも確かにありますが、多くの場合そこを「頑張る」のはみなさんの本業ではないでしょう。

餅は餅屋。世にある「オブザーバビリティツール」と呼ばれる製品群は、この「より高い可観測性」を実現するために存在します。

今回はここで、New Relic を使ってのデモを行いました。
既存の WordPress が動いている環境に New Relic を入れることで、どのようなことが観測可能になるか。。ということをお見せしたかったのですが、あまり時間もなく中途半端だったかもしれません。いずれまたどこかでお見せできればと思ってます!

202407-the-journey-to-operational-excellence-devio2024fukuoka_5_1600.jpg

まとめ

デモまで含めて 25 分枠ということで、十分お伝えできたか不安なのですが、聞いて下さった方々ありがとうございました!

姉妹セッションというか、より可観測性にフォーカスした内容のセッションをこちらでもお話ししましたので、是非こちらの資料も見て頂けますと幸いです。

https://dev.classmethod.jp/articles/202407-differences-between-monitoring-and-observability-devio2024/

余録:運用 or 運用上

202407-the-journey-to-operational-excellence-devio2024fukuoka_6_1600.jpg
謹んでお詫び申し上げます

脚注
  1. セッションでは「ステージ」としましたが、元資料では Domain と表記されています ↩︎

この記事をシェアする

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.